直接上代码
前言生成csv格式的时候,可以禁止生成索引【删除了是第一列】
在生成csv文件时设置成不生成索引!!加上 index=False 就好了
dataset.to_csv(‘dataset2_train.csv’, index=False)
代码开始
import datetime #datetime是Python处理日期和时间的标准库。
import pandas as pd #引入pandas包 处理表格
#读取的文件为pandas的dataFrame数据类型
date = pd.read_csv('date日期.csv',encoding='utf-8') #读取日期文件 encoding 为指定日期格式
#print("Type(data)",type(data)) #查看data的数据类型
print("date:\n",date[:5]) #显示数据前五行
![在这里插入图片描述](https://img-blog.csdnimg.cn/20210109193159855.png)
# DataFrame表中取出列数据
years = date['年'] #获取“年”列的数据
months = date['月']#获取“月”列的数据
days = date['日']#获取“日”列的数据
#将年月日组合成字符串格式
data_dates=[str(int(年))+'-'+str(int(月)) + '-' +str(int(日)) for 年,月,日 in zip(years,months,days)]
#把时间转换为datetime格式 字符串各自转化为所需的格式
data_dates = [datetime.datetime.strptime(date,'%Y-%m-%d') for date in data_dates]
print("data_dates:",data_dates[:5])
结果
datetime.datetime(2016, 1, 6, 0, 0), datetime.datetime(2016, 1, 7, 0, 0), datetime.datetime(2016, 1, 8, 0, 0), datetime.datetime(2016, 1, 9, 0, 0), datetime.datetime(2016, 1, 10, 0, 0)
解释一下将三列合并为字符串的语句
data_dates = [str(int(年))+'-'+str(int(月)) + '-' +str(int(日)) for 年,月,日 in zip(years,months,days)]
#[] 表示为列表数据类型
#int(年) #将内容强制转换为int格式
#str() #转化为字符串样式
# str(int(年))+'-'+str(int(月)) + '-' +str(int(日)) #进行字符串拼接
# + 加号为字符串连接符
#zip(years,months,days) 将三列数据进行打包处理
#上述语句可以写为
data_dates = []
for 年,月,日 in zip(years,months,days):
data_dates.append(str(int(年))+'-'+str(int(月)) + '-' +str(int(日)))
|